Например, Бобцов

ПРИМЕНЕНИЕ МЕТОДА НЕЗАВИСИМЫХ КОМПОНЕНТ ДЛЯ ОПРЕДЕЛЕНИЯ НАЧАЛЬНОГО ПРИБЛИЖЕНИЯ ПРИ ПОИСКЕ АКТИВНЫХ МОДУЛЕЙ В БИОЛОГИЧЕСКИХ ГРАФАХ

Аннотация:

Предмет исследования. Поиск активных модулей в биологических графах, в том числе в генных графах, является одним из важных подходов к интерпретации экспериментальных биологических данных. Один из методов ее решения основан на применении алгоритма совместной кластеризации в графовом и корреляционном пространствах. Алгоритм находит группы генов, одновременно близко расположенные в генном графе и обладающие высокой попарной корреляцией по матрице значений экспрессии генов. Алгоритм является итеративным, одиниз его ключевых параметров–выбранное начальное приближение, от которого зависит время работы и качество получаемых результатов. В настоящей работе рассмотрена задача определения начального приближения для этого алгоритма. Для решения задачи предложено использование процедуры на основе метода независимых компонент. Метод. На первом шаге предлагаемой процедуры определения начального приближения применяется метод независимых компонент к центрированной матрице значений экспрессии генов. Далее для каждой компоненты определяются гены, которые ей соответствуют с заданным уровнем статистической значимости. Полученные группы генов для всех независимых компонент выбираются в качестве начального приближения. Основные результаты. Применение процедуры на основе метода независимых компонент позволитуменьшить число групп генов в начальном приближении без потери точности, что, в свою очередь, уменьшитвремя работы алгоритма кластеризации в десяткираз при сохранении качества результатов. Практическая значимость. Ускорение работы алгоритма совместной кластеризации в графовом и корреляционном пространствах без потери качества результатов значительно повыситудобство его использования для интерпретации транскриптомных данных в биоинформатике и вычислительной биологии.

Ключевые слова:

Статьи в номере